Заглавие

Text copied to clipboard!

Инженер по Големи Данни

Описание

Text copied to clipboard!

Търсим Инженер по Големи Данни, който да се присъедини към нашия екип и да играе ключова роля в изграждането и поддръжката на мащабируеми, надеждни и ефективни платформи за обработка на големи обеми от данни. Кандидатът трябва да има опит в проектирането, разработването и внедряването на решения за събиране, съхранение и анализ на данни в реално време и в пакетен режим. Като Инженер по Големи Данни, ще работите в тясно сътрудничество с екипи от анализатори, учени по данни и софтуерни инженери, за да осигурите стабилна инфраструктура за данни, която поддържа вземането на бизнес решения. Ще използвате модерни технологии като Apache Spark, Hadoop, Kafka, Hive, Airflow и други, за да създавате ETL процеси, да оптимизирате производителността и да гарантирате сигурността и качеството на данните. Идеалният кандидат има силни познания по програмиране (Python, Java или Scala), разбиране на архитектури за данни, както и опит с облачни платформи като AWS, Google Cloud или Azure. Очакваме от вас да демонстрирате аналитично мислене, внимание към детайла и способност за работа в динамична среда. Ако сте мотивиран специалист с желание да работи върху иновативни проекти и да допринася за развитието на данни-ориентирана култура, ще се радваме да се свържете с нас.

Отговорности

Text copied to clipboard!

Проектиране и разработване на мащабируеми архитектури за данни
Изграждане и поддръжка на ETL процеси
Интегриране на различни източници на данни
Оптимизиране на производителността на системите за данни
Осигуряване на качество и сигурност на данните
Работа с облачни платформи за съхранение и обработка на данни
Сътрудничество с екипи от анализатори и учени по данни
Автоматизиране на процеси за обработка на данни
Мониторинг и отстраняване на проблеми в инфраструктурата за данни
Документиране на архитектури и процеси

Изисквания

Text copied to clipboard!

Бакалавърска или магистърска степен в областта на компютърните науки или сходна
Опит с технологии като Hadoop, Spark, Kafka, Hive
Добри умения за програмиране на Python, Java или Scala
Опит с облачни платформи (AWS, GCP, Azure)
Познания по SQL и NoSQL бази данни
Разбиране на архитектури за данни и моделиране
Умения за работа в екип и комуникация
Аналитично мислене и внимание към детайла
Опит с инструменти за оркестрация като Airflow
Желание за учене и прилагане на нови технологии

Потенциални въпроси за интервю

Text copied to clipboard!

Какъв е опитът ви с Apache Spark или Hadoop?
Работили ли сте с облачни платформи и кои?
Как подхождате към оптимизацията на ETL процеси?
Какви инструменти използвате за мониторинг на инфраструктурата?
Можете ли да опишете проект, в който сте интегрирали различни източници на данни?
Как гарантирате сигурността и качеството на данните?
Какви бази данни предпочитате за различни типове данни?
Какви са предизвикателствата при работа с големи обеми от данни?
Какви технологии бихте искали да научите в бъдеще?
Как се справяте с работа в динамична и бързо променяща се среда?

Заглавие

Инженер по Големи Данни

Описание

Отговорности

Изисквания

Потенциални въпроси за интервю

Необходими умения

Свързани длъжностни описания